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摘 要 : 贝 叶 斯 统计 应 


增加 。 贝 叶 斯 因 


bb 


能 分 


子 


当前 数据 更 支持 哪 


与 应 


实例 数据 ， 展 示 如 何 


内 设计 、 二 因 


进行 统计 推断 


素 组 间 设 计 、 二 因 


假设 或 模型 的 判断 。 然 而 ， 国 


在 JASP 中 对 五 种 常用 的 心理 


[ 报 和 解读 结果 。 贝 叶 斯 方差 分 析 提 供 


H. 


P 


的 有 力 工 


j 于 假设 检验 的 方法 一 一 贝 叶 斯 


别 量 化 所 文 持 的 相应 假设 或 模型 的 证 据 ， 进 而 根据 其 数 


内 尚 缺 乏 对 方差 分 析 的 贝 叶 


] 的 介绍 。 基 于 此 ， 本 文 首先 介绍 贝 叶 斯 方差 分 析 的 基本 思路 及 计 


素 组 内 设计 和 二 因 


Keim: 贝 叶 斯 统计 ; 贝 叶 斯 


1 


引言 


量 ( 因 


验 (null hypothesis significancetesting,NHST) 的 相 


统计 显著 性 推断 ， 当 设 定 了 p (ABIL, i 


变量 ) 的 影响 ， 是 实验 心理 


讯 作 者 : 胡 传 鹏 ， 


， 博 士 ， 


南京 师范 大 学 心理 


方差 分 析 (ANOVA) 这 一 统计 方法 适用 于 评估 分 类 型 预测 变量 ( 


究 者 往往 会 根据 p 值 ， 


学 实验 设计 ( 单 因 


素 混 合 


因子 ; 方差 分 析 ; JASP 


因子 一 一 在 心理 


南京 210024) 


学 研究 中 的 应 用 


值 大 小 


斯 因子 


原理 ， 


素 组 间 设 计 、 单 因 


自 变 量 ) 对 连续 


H 


E 架 下， 方差 分 析 得 到 的 结果 会 根据 p 值 进行 


型 gt 


日 渐 


做 出 


的 原 


素 组 


设计 ) 进 行 贝 叶 斯 方差 分 析 及 如 何 


了 一 个 能 有 效 蔡 代 传 统 方差 分 析 的 方案 ， 是 研究 者 


果 变 


学 中 常用 的 统计 方法 (Fritz et al., 2012)。 在 零 假设 显著 性 检 


以 全 或 无 的 方式 推 
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如 果 p>0.05， 就 说 明 结果 不 具有 统计 显著 折 


是 心理 


Fate, WAS 


/E(Wagenmakers et al., 2011). 


贝 叶 斯 统计 的 基本 


FA AB 4 


IRD toy AE 


(ii 


Lo 


这 种 二 


。 例 如 ， 如 果 p < 0.05， 就 说 明 结果 有 具有 统计 显著 性 ， 应 当 


分 


tit (Bayesian statistics) 作 为 一 种 替代 NHST 的 方法 ， 


ANS 


色 零 假设 (0); 


的 观点 受到 了 广泛 质疑 ， 并 


这 也 


学 可 重复 性 危机 的 来 源 之 一 (Open Science Collaboration, 2015; Schmalz et al., 2021). 


BS 


7b 


逐渐 受到 了 和 


者 的 关 


观测 数据 的 积累 ， 信 念 (知识 经 验 ) 不 断 更 新 的 过 程 


(Faulkenberry et al., 2020; van den Bergh et al., 2020; Wagenmakers, Marsman, et al., 2018)。 研 


究 者 在 进行 


的 估计 。 当 某 


段 设 检 验 前 可 能 会 


好 的 


假设 对 观测 数 


comparison) 的 方式 来 得 


许 后 


得 到 支持 Hi 和 Ho 的 证 据 ， 


fhe 等 , 2022)。 


的 预测 性 


预测 数据 


到 贝 叶 斯 


时 ， 


[el 
EA 


BOR UL eit 


具有 


里 


有 多 个 相互 竞争 的 假设 ， 


言 念 即 是 对 各 个 假设 为 真 的 可 


与 该 假设 一 致 的 信念 会 


时 ， 信 念 就 会 减弱 。 因 此 通过 


进而 量化 两 种 假设 相对 出 现 


因子 (Bayes factors, BF; WEIG 等 


得 到 增强 ， 反 之 ， 当 某 


贝 叶 斯 统计 ， 研 究 者 可 以 分 别 


的 可 能 性 ， 即 通过 模型 上 


上 较 (model 


, 2018; 李 贵 玉 , MYT, 2021; 


化 对 如 和 Fo 的 支持 程度 、 不 依赖 于 抽样 计划 等 


优势 (Griinwald et al., 2020; Hendriksen et al., 2021; Schmalz et al., 2021; Wagenmakers, Marsman, 


et al., 2018)， 但 


界面 的 软件 


相 比 于 频率 主义 ANOVA， 贝 叶 斯 ANOVA 的 应 


] 是 有 了 


pa 


的 。 随 着 具有 


形 


(例如 ，JASP) 的 开发 ，BF 的 使 用 变 得 


更 加 简便 ， 因 此 


TH 


也 开始 被 广泛 应 用 于 心理 


So 


学 的 各 个 领域 (和 孟 迎 芳 等 , 2021; Brydges & Gaeta, 2019; Derks et al., 2021; Rouder et al., 2017; 


鹏 等 (2018) 文 章 


Wagenmakers, Love, et al., 2018)。 先 前 亦 有 中 文 文献 对 JASP HEAT SF AAS TPZ 


， 例 如 ， 胡 传 


E 3.1 部 分 。 如 果 需 要 了 解 更 多 关于 NHST 与 BF 的 内 容 ， 可 参考 前 人 研究 


(Kruschke & Liddell, 2018; Schmalz et al., 2021; Tendeiro & Kiers, 2019). 


吴 凡 等 


, 2018)。 


先前 关于 BF 的 中 


文 介绍 


ro 


虽然 容易 理解 


? 但 无 ; 


YZ 


MA 
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日 于 方差 分 析 的 情境 


， 多 以 相关 分 析 和 上 检验 作为 例子 ( 胡 传 鹏 等 , 2018; 


中 。 主 要 原因 之 一 在 于 ， 贝 


叶 斯 ANOVA 以 贝 叶 斯 的 线性 模型 linear model, LM) 为 基础 (Liang et al., 2008; Rouder et al., 


2012)。 昌 然 也 可 以 使 用 贝 叶 斯 广义 线性 模型 (Generalized linear model, GLM)， 但 当前 版 本 


的 JASP 并 不 能 进行 贝 叶 斯 GLM 的 相关 计算 。 贝 叶 斯 ANOVA 通过 多 个 不 同 的 线性 模型 相 


互 之 间 的 比较 获得 BF 值 。 不 同 模型 可 能 涉及 到 不 同 的 模型 构建 方式 ， 这 就 导致 了 相 比 于 贝 


叶 斯 1 检验 ， 模 型 比较 的 过 程 更 为 复杂 。 此 外 ， 随 着 自 变量 的 增加 ， 模 型 比较 及 之 后 产生 的 


模型 选择 不 确定 性 的 问题 会 对 研究 者 汇报 和 解释 结果 造成 困扰 。 因 此 ， 如 何 解决 这 种 情况 


下 的 BF 计算 与 解读 ， 也 需要 额外 的 知识 。 为 解决 研究 者 在 使 用 贝 叶 斯 ANOVA 时 可 能 出 现 


的 上 述 问 题 ， 本 文 将 介绍 贝 叶 斯 线性 模型 及 模型 比较 的 基础 知识 ， 并 介绍 贝 叶 斯 模型 平均 


法 (Bayesian model averaging, BMA) 这 一 解决 自 变 量 较 多 时 如 何 计算 贝 叶 斯 因子 的 方法 。 为 


了 方便 没有 代码 基础 的 研究 者 执行 数据 分 析 ， 本 文 使 用 了 JASP 这 款 开源 、 免 费 和 具有 图 形 


界面 的 统计 软件 (JASP team, 2022)。 如 果 读 者 仅 关 注 如 何 使 用 JASP 来 进行 贝 叶 斯 ANOVA 


分 析 ， 以 及 如 何 解释 和 汇报 输出 的 结果 ， 可 跳 过 本 文 的 2.2 小 节 。 


2 EARS 


2.1 贝 叶 斯 因子 


BF 是 一 种 模型 比较 和 选择 的 方法 ， 反 映 了 对 某 一 模型 支持 程度 的 量化 (Schmalz et al., 


2021)。 它 等 价 于 观测 数据 中 两 个 模型 的 边际 似 然 之 比 (marginal likelihood ratios; Heck et al., 


2022)。 在 应 用 于 假设 检验 中 时 ， 假 设 之 间 的 比较 可 视 作 模型 之 间 的 比较 。 因 此 ，BF 可 用 


来 衡量 对 Ay 和 Ho 的 支持 程度 。 具 体 而 言 ， 将 Ho tHE NERA (null model)Mo 并 将 Ay 指定 


为 备 择 模型 (alternative model)M1。BFio 表 示 相 对 于 Mo， 观 测 数据 对 Mi 的 支持 程度 。 例 如 ， 


BF = 12 表示 观测 数据 支持 已 为 真 的 程度 是 支持 Fo 为 真 的 程度 的 12 倍 。 如 表 1 所 示 ， 参 


考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 划分 ( 胡 传 鹏 等 , 2018; Jarosz & Wiley, 2014; 
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Jeffreys, 1961; Wetzels et al., 2011), BFio= 12 可 被 解释 为 观测 数据 提供 了 较 强 的 证 据 支 持 已 


NA» RÈ, BFo= 12 可 被 解释 为 观测 数据 提供 了 较 强 的 证 据 支 持 Ho A 


K 1 BFio 数 值 划 分 及 划 


BFio 
> 100 
30-100 
10-30 
3-10 
1-3 
1 
1/3-1 
1/10 — 1/3 
1/30 — 1/10 
1/100 — 1/30 
< 1/100 


BF 计算 的 一 般 公 式 为 : 


BFio = 


同 理 。 


其 中 ，p(data|Mi) 表 示 边 际 似 然 ， 


因此 ，BFio 反 映 了 两 个 模型 的 边际 似 然 之 比 。 关 于 上 式 的 进一步 展 


代表 意义 


代表 意义 

的 证 据 支 持 Mi 

非常 强 的 证 据 支 持 Hi 

较 强 的 证 据 支 持 Hi 

中 等 程度 
的 


极 强 


的 证 据 支 持 Hi 
BESS AVI 


_ p(data|M,) 
p(data|My) 


即 当前 数据 在 模型 Mi 中 出 现 的 可 能 性 


1) 


E, p(data|M)) 


补充 材料 A( 在 线 补充 材料 详 见 https://osf.io/7caju/)。 


2.2 贝 叶 斯 ANOVA 中 线性 模型 的 比较 


要 理解 BF 在 ANOVA 中 的 应 用 ， 


贝 叶 斯 ANOVA 中 BF 值 的 计生 


形式 ，ANOVA 涉及 的 自 变 量 是 分 类 变量 ， 


首先 需要 理解 方差 分 析 与 线性 模型 的 关系 ， 原 因 在 于 


的 特殊 之 处 在 于 : 由 于 自 


态 分 布 。 


变量 为 分 类 变量 (例如 ， 性 别 、 不 同 实验 条 件 等 )， 


Ber FE ME (design matrix) 中 包含 的 元 素 均 为 0 或 1。 线 性 模型 的 一 般 形式 为 : 
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ER, MER 


是 基于 不 同 线性 模型 之 间 的 比较 。 作 为 线性 模型 的 一 种 特殊 


变量 是 连续 变量 ， 且 误差 项 (error) 需 要 满足 正 


其 


7x 


其 中 ， 鸣 表示 因 变 量 ， 


i 属于 组 j; Bj 表示 


vo 


假设 存在 一 个 两 水 平 的 


1 因 变 量 无 法 被 自 变量 


Yij 二 从 + BiXis 十 «+ ByXij + Eij (i = 1,2, ery 


n) 


2) 


即 j 组 个 体 i 的 数据 ;Xi 表示 自 变量 ， 取 值 为 0 或 1， 代 表 个 体 


解释 的 部 分 。 


0 


自 变革 


mj 
pe 


行 标准 化 9 = (代表 标准 误 )， 即 转化 为 效应 量 (effeet size). 


那么 计 


A 存在 效应 的 线性 模型 可 写成 : 


Hy:Y =u+o0x +e 


不 包括 A 效应 的 零 模 型 写作 : 


万 0: 了 = 人 十 6 


QU RA 


五 值 和 pp 值 ， 再 在 零 假设 显著 性 检验 框架 下 i 


前 数据 出 现在 Ho 和 Hi 


存在 的 Ay 指 


出 数据 支持 两 个 模型 可 


上 述 内 容 


模型 的 数量 增加 。 从 完全 不 包括 任何 自 


究 者 关注 A 的 主 效应 ， 在 传统 的 ANOVA 中 ， 可 以 通过 方差 分 解 的 方式 来 i 


这 两 个 模型 下 的 可 能 性 的 比例 。 


ITA ER. E BF AAT, Fi 


也 就 是 说 ,而 


A， 且 为 了 使 参数 不 受 计 量 单位 的 影响 ， 需 


自 变 量 的 效应 ， 即 某 个 实验 处 理 的 效应 ，/ 表 示 截 距 项 ;， eij 表 示 随 机 误差 ， 


要 将 参数 进 


3) 


4) 


能 性 的 比值 ， 得 到 BF io BK BFoio 


站 述 的 是 仅 有 一 个 自 变量 的 情况 。 当 存在 两 个 自 变 量 


变量 效应 的 模型 ( 零 模 型 


究 者 将 认为 A 主 效应 


定 为 Mi, WA A 主 效应 不 存在 的 Ao 指定 为 Mo， 通 过 模型 比较 的 方式 来 计生 


Xa 和 Xp 


DIAE ab 


模型 (两 个 自 变量 的 主 


时 ， 潜 在 线性 


自 变 量 效 应 的 


效应 及 其 交互 作用 ， 即 全 模型 )， 共 包括 5 个 模型 (模型 的 构建 请 见 补 


FATE B)。 如 果 以 零 模 型 作为 了 夯 的 模型 ， 则 与 传统 的 ANOVA 仅 有 两 主 效应 与 一 个 交互 作 


JAY F Eb 


包括 交互 作 月 


(及 p 值 


芷 用 的 模型 ( 见 线 上 补充 材料 B 中 的 公式 12) 也 会 与 零 模型 


) 不 同 ，BF 分 析 中 会 报告 4 个 BF 值 。 
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HARE 8 DENY a SE, TM eh A ee BEA. ER 


这 是 因为 仅 包括 两 个 主 效应 但 无 交互 


J 进行 比较 从 而 得 到 BF 值 。 并 且 ， 


九 


者 想 计 算 交 互 作用 所 对 应 的 BF 值 ， 可 以 应 用 BF 的 传递 性 (Srinivasan & Vijayaragunathan, 


2021; Wagenmakers et al., 2010). (Kit § 


由 此 可 见 ， 随 着 自 


单独 地 考虑 每 个 模型 


的 效应 。 同 


变量 个 数 的 增加 ， 模 型 


原理 请 见 补充 材料 C。 


的 数量 也 会 迅速 增加 。 


时 ， 模 型 两 两 比较 产生 的 BF 数量 也 随 之 增加 ， 这 会 对 


这 就 导致 有 


完 者 很 难 


完 


者 解释 结果 造成 困扰 。 当 古 选 择 不 同 的 模型 时 ， 与 如 对 应 的 原 模 型 比较 产生 可 能 会 产生 几 


个 数值 相似 的 B 瑟 o 时 ( 即 有 相同 程度 的 证 据 支 持 几 个 模型 作为 到)， 王 


究 者 该 如 何 选择 合适 


的 模型 作为 所 进而 得 出 结论 ? 当 实 验 中 存在 2 个 自 变量 时 ， 可 供 友 选择 的 备 择 模型 有 4 个 ; 


当 存 在 3 个 自 


HHS FEM p ERED F BF 的 数量 。 


者 甚至 可 能 会 为 了 追求 BF 值 最 大 化 ， 选 取 特 定 的 模型 ， 从 而 忽略 了 模型 选择 的 不 确定 性 。 


变量 时 ， 可 供 选 择 的 备 择 模型 


据 此 ， 研 究 者 提出 使 用 


这 


就 增长 到 了 187. | 


就 造成 了 研究 者 在 模型 


此 可 见 ， 传 统 ANOVA 得 


选择 上 会 出 现 


Ls 


难 。 研究 


贝 叶 斯 模型 平均 (Bayesian model averaging, BMA) 的 方法 来 解决 这 一 


问题 (Heck & Bockting, 2021; Heck et al., 2022; Hinne et al., 2020; van den Bergh et al., 2020; 


Wagenmakers, Love, et al., 2018)。 关 于 BMA 的 详细 信息 请 见 在 线 补充 材料 D。 


2.3 JASP 中 进行 贝 叶 斯 ANOVA 


本 文 使 用 的 JASP 版 本 为 0.16.3(JASP Team, 2022)， 所 


上 获取 (https://osf.io/7caju/)。JASP 是 一 个 不 断 开 发 中 的 软件 ， 开 发 者 不 断 地 改进 该 软件 并 


修复 现 有 版 本 中 的 


问题 。 


因此 ， 我 们 推荐 读者 使 用 最 新 版 的 JASP 而 非 一 定 要 使 用 本 版 


] 示 例 数据 及 分 析 结 果 可 在 OSF 


本 。JASP 使 用 RR 中 的 BayesFactor 包 (Morey & Rouder,2022) 计 算 BF。 在 进行 贝 叶 斯 ANOVA 


究 者 需要 进行 


HE, A 


不 同 于 传统 ANOVA KtR H 


的 基本 步骤 是 : 


指定 自 变 量 和 因 
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变量 、 选 择 输 出 的 BF 


指标 (Fp, 172 等 )， 在 JASP 中 进行 贝 叶 斯 ANOVA 后 ， 


Bi. 如 果 是 多 


出 如 下 指标 ( 见 图 2): Model Comparison 为 模型 比较 的 结果 汇总 表 ; PC(M) 表 示 获 得 观测 数据 


前 模型 的 先 验 概 率 ， 在 默认 的 Uniform 分 布 中 每 个 模型 的 先 验 概率 相同 ， 即 如 果 有 m 个 模 


型 ， 每 个 模型 的 先 验 概率 就 为 /m; P(M|data) 表 示 获 得 数据 后 模型 的 后 验 概 率 ; BFm 表 示 


当前 模型 从 先 验 到 后 验 的 变化 : 


P(M|data) 1—P(M) 


Bie ey Ne 
M = 7_P(Midata) PM) 


5) 


Error % 表 示 结 果 的 变异 系数 。 由 于 在 计算 过 程 中 使 用 了 MCMC 采样 ， 因 此 每 重新 运 


行 一 次 分 析 ， 结 果 都 可 能 会 出 现 细微 的 差异 。 因 此 ， 按 照 本 文 步骤 ， 读 者 所 做 的 贝 叶 斯 


ANOVA 结果 可 能 会 与 本 文 得 到 的 结果 有 细微 不 同 。 结 果 的 波动 可 用 Eror % 来 量化 ，Error % 


越 高 说 明 结果 的 波动 性 越 高 。van Doorn 等 (2021) 推 荐 Error % 小 于 20% 时 通常 是 可 以 接受 


的 。 


3 ”使 用 JASP 进行 贝 叶 斯 ANOVA 实例 展示 


3.1 单 因 素 方差 分 析 


示例 数据 。 使 用 疼痛 闵 限 (Pain Thresholds) 数 据 作 为 示例 ， 该 数据 来 自 单 因 素 组 间 设 计 


的 实验 。 自 变量 为 发 色 (Hair Color)， 包 括 4 个 水 平 ( 见 图 1): 深 色 黑 发 (Dark Brunette) RE 


金发 (Dark Blond)、 浅 色 金 发 (Light Blond), RERA (Light Brunette)。 因 变量 为 疼痛 容忍 度 


(Pain Tolerance)。 因 此 在 本 例 中 ，#f ARES NIRE, Ay AA PS BR A S 


啊 。 例 如 ， 浅 色 金 发 个 体 对 疼痛 的 容忍 度 要 高 于 浅 色 黑 发 个 体 。 
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Pain Tolerance 


bta 


| | | | 
Dark Blond Dark Brunette Light Blond Light Brunette 


Hair Color 


图 1 JASP 中 示例 数据 疼痛 浆 限 的 描述 


统计 结果 


操作 步骤 。 首 先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA - Pain Thresholds), 


然后 在 ANOVA 面板 中 选择 “Bayesian AVOVA”。 之 后 需要 进 


行 以 下 步骤 ( 见 图 2): 第 一 ， 将 


疼痛 容忍 度 作为 因 变 量 放 入 “Dependent Variable” 中 ， 将 发 色 作为 自 变 量 放 入 “Fixed Factors” 


A; 第 二 ， 在 “Bayes Factor” 选 项 框 中 选择 要 输出 的 BF 形式 ;， 第 三 ， 在 “order” 选 项 框 中 选 


择 模 型 比较 的 顺序 ， 即 确定 模型 是 与 零 模型 (null modeD 还 是 与 最 优 模 


型 (best model) 进 行 比 


较 。 如 果 选 择 “compare to best model”*”， 那 么 “Model Comparison”* 中 呈现 结果 的 第 一 行 就 代表 


最 优 模 型 与 其 自身 比较 的 结果 。 反 之 ， 如 果 选 择 “compare to null model*， 那 么 就 代表 零 模 


型 与 其 自身 比较 的 结果 。 因 此 “order”" 的 选择 对 结果 没有 实际 影响 ， 第 四 ， 由 于 该 示例 数据 


中 的 自 变量 发 色 是 一 个 四 水 平 组 间 变 量 ， 因 此 需要 事后 检验 (Post Hoc Tests) 来 观测 差异 究竟 


出 现在 哪 两 个 水 平 之 间 。 然 而 ， 事 后 检验 本 身 是 一 个 探索 怡 


研究 者 在 进行 数据 分 析 前 ， 需 要 做 出 明确 假设 。 


的 分 析 过 程 。 


因此 ， 本 文 建议 


贝 叶 斯 方差 分 析 中 的 事后 检验 无 需 进行 校正 (Gelman et al., 2012)。 不 同 于 依赖 预 设 显著 
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性 水 平 以 及 p 值 的 NHST， 贝 叶 斯 方差 分 析 关 注 参 数 或 模型 的 后 验 分 布 及 观测 数据 对 不 同 


假设 的 支持 程度 。 贝 叶 斯 方差 分 析 提 供 了 完整 的 后 验 分 布 ， 使 得 研究 者 可 以 直接 对 不 同 模 


型 的 后 验 分 布 进行 比较 。 并 且 ， 贝 叶 斯 方差 分 析 允 许 研究 者 设 定 不 同 的 先 验 分 布 形式 ， 来 


反映 对 不 同 假设 的 5 


E 验 信念 。 


贝 


叶 斯 


子 的 本 质 是 两 个 模型 边际 似 然 的 比值 ， 量 化 了 对 模 


型 的 相对 支持 程度 ， 直 观 的 对 模型 进行 了 比较 。 综 上 ， 在 贝 叶 斯 方差 分 析 中 无 需 使 用 多 重 


比较 校正 。 


= bW BR Oe ee OA e ” Oot 
= = a = y > 中 
一 
Descriptives T-Tests ANOVA Mixed Models Regression Frequencies Factor JAGS LearnBayes Machine Learning Meta-Analysis Reliability SEM 
a T 
avi Dependent Variable Bayesian ANOVA 
LZ Ñ, Pain Tolerance 
EN Model Comparison 
Ld & Hair Color 
Models PM) P(uidata) BFM BF10 error % 
: 1 Í| Nul model 0.500 0.077 0.084 1.000 
Hair Color 0.500 0.923 11.969 11.909 0.004 
1 
Post Hoc Tests 
Random Factors 
> Post Hoc Comparisons - Hair Color 
Prior Odds PosteriorOdds BF to,u error % 
Dark Blond Dark Brunette 0.414 0.904 2184  2.754e-5 
Light Blond 0.414 0.362 0.875 0.004 
4 4 Light Brunette 0.414 0.433 1.045 0.011 
å Dark Brunette Light Blond 0.414 4506 10878 4244e-6 
| Light Brunetto 0.414 0.290 0.700 0.002 
Light Blond Light Brunette 0.414 4.931 4661 0.003 
Bayes Fador Tabios Note. The posterior odds have been corrected for multiple testing by fixing to 0.5 the prior 
O BF。 Effects probability that the null hypothesis holds across all comparisons (Westfall, Johnson, & Utts 1997). 
Individual comparisons are based on the default t-test with a Cauchy (0, r= 1/sqrt(2)) prior. The "U" 
Bra 1 in the Bayes factor denotes that itis uncorrected. 
Log (BF) 1 
Estimates 
这 Descriptives 
Model averaged RE 
: Descriptives $| Descriptives plots 
Credible interval 95.0  % 
Order Plots 
70 
Compare to best model Model averaged posteriors 
O Compare to null model | 3 i a plat 60 — T 
h 


Compare to best model 


© Compare to null modol 


> Model 


> Single Modd inference 


2 使 用 JASP 进行 单 因素 方差 分 析 的 操作 截屏 


Model averaged posteriors 


Q-Q piot of residuals 
Posterior R? 


Bayesian ANOVA 


Model Comparison 


[V Post Hoc Tests 


> 


& Hair Color 


Correction 
Null control 


> Descriptives Plots 


> Raincloud Plots 


> Additonal Options 


4 


Models PM) P(uidata) BFw BF10 error % 
$| Nul model 0.500 0.077 0.084 1.000 
Hair Color 0.500 0.923 11.969 11.969 0.004 
Post Hoc Tests 
Post Hoc Comparisons - Hair Color 
Prior Odds PosterorOdds BFio,u error % 

Dark Blond Dark Brunette 0.414 0.904 2.184 2.754e-5 
Light Blond 0.414 0.362 0.875 0.004 
4 Light Brunette 0.414 0.433 1.045 0.011 
Dark Brunette Light Blond 0.414 4.506 10.878  4.244e-6 
Light Brunette 0.414 0.290 0.700 0.002 
Light Blond Light Brunette 0.414 1931 4.661 0.003 


Note The posterior odds have been corrected tor multiple testing by fxing to 0.5 the prior 
probability that the null hypothesis holds across all comparisons (Westfall, Johnson, & Utts, 1997). 
Individual comparisons are based on the default t-test with a Cauchy (0, r = 1/sart(2)) prior. The "U" 
in the Bayes factor denotes that it is uncorrected. 


Descriptives 


Descriptives plots 


SES 


图 3 使 用 JASP 进行 事后 检验 的 操作 截屏 
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结果 汇报 。 贝 叶 斯 ANOVA 的 结果 显示 : 参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011)， 贝 叶 斯 因子 BFini= 11.97， 说 


明 在 当前 数据 中 到 出 现 的 可 能 性 是 Ao 的 11.97 倍 。 这 是 较 强 的 证 据 支 持 了 Ho WAIE 


色 的 个 体 有 着 不 同 的 疼痛 容忍 度 。 通 过 事后 检验 发 现 ， 当 前 数据 中 出 现 浅 色 金 发 个 体 (Light 


Blond) 对 疼痛 的 容忍 度 高 于 深 色 黑 发 个 体 (Dark Brunette) 的 可 能 性 是 二 者 无 差异 的 10.88 倍 


(BFio= 10.88， 较 强 证 据 支 持 H)， 浅 色 金发 个 体 (Light Blond) 对 疼痛 的 容忍 度 高 于 浅 色 黑 发 
个 体 (Light Brunette; BF\o= 4.66， 中 等 程度 证 据 支 持 Ai); 深 色 金发 个 体 (Dark Blond) 对 疼痛 


的 容忍 度 高 于 深 色 黑 发 个 体 (BFio= 2.18， 较 弱 证 据 支 持 Ai); 其 余 条 件 两 两 比较 之 间 无 证 据 


支持 存在 差异 或 者 不 存在 差异 (83Fio 均 小 于 1.05)。 


3.2 二 因素 方差 分 析 


示例 数据 。 使 用 心率 (Heart Rate) 数 据 作为 示例 ， 该 数据 来 自 2x2 组 间 设 计 的 实验 。 自 


变量 是 性 别 (Gender) 和 组 别 (Group)， 因 变量 为 运动 六 分 钟 后 的 心率 ( 见 图 4)。 因 此 在 本 例 中 ， 


Ho 为 不 同 的 性 别 和 组 别 对 心率 的 影响 无 显著 差异 ， 为 性 别 和 组 别 不 仪 存在 主 效应 ， 且 二 


者 的 交互 作用 也 存在 。 
250 -< 180 = 
160- ° 
200 - y . 
0 Pt o 140- e 
È “ee È 120- 
150 4 
T 5 100- 
I z A 
J 80 e 
100 a i 
e 60 4 
50 - 40- 
I 1 [ 1 
Female Male Female Male 
Gender Gender 
Control Runners 


图 4JASP 中 示例 数据 心率 的 描述 统计 结果 
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操作 步骤 。 首 先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA - Heart Rate)， 然 后 


在 ANOVA 面板 中 选择 “Bayesian AVOVA”。 之 后 需要 进行 以 下 步骤 : 第 一 ， 将 心率 作为 因 


变量 放 入 “Dependent Variable" 中 ， 将 性 别 和 组 别 作为 自 变 量 放 入 “Fixed Factors” 中 ;第 二 ， 


在 “Bayes Factor” 选 项 框 中 选择 BF io 作为 要 输出 的 BF 的 形式 ; 第 三 ， 在 “order” 选 项 框 中 选 


择 “compare to null model”; 第 四 ， 在 多 因素 实验 设计 中 ， 如 果 需 要 计算 BFin./， 就 需要 勾 选 


“Effects”"。 并 且 选 择 “Across all models” 和 “Across matched models”* 方 法 所 计算 出 的 BFiwa 是 不 


同 的 。 本 文 建议 采取 Sebastiaan Math6t 提倡 的 “Across matched models” 方 法 计算 的 结果 ( 见 图 


Sa 


ee 
[a] 


5A); 第 五 ， 由 于 贝 叶 斯 ANOVA 没有 简单 效应 分 析 的 模块 ， 如 果 研 究 中 需要 进行 进 


单 效应 分 析 ， 可 通过 贝 叶 斯 1 检验 进行 简单 效应 分 析 。 


具体 而 言 ，“Effects” 的 选择 会 影响 BFiva 的 计算 。 在 进行 BFina 的 计算 前 ， 首 先 要 了 解 


如 何 计算 P(incl)、P(excl)、P(inclldata) 和 P(exclldata)。 在 JASP 中 ， 这 四 个 值 的 计算 有 


两 种 ;包括 所 有 模型 的 取向 (across all models) 和 包括 匹配 模型 的 取向 (across matched models). 


两 种 取向 的 选择 在 JASP 中 的 操作 见 图 SA。 这 两 种 取向 之 下 的 计算 公式 有 所 区 别 ， 有 具体 计 


算 过 程 见 在 线 补充 材料 EE。 
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A Y Bayesian ANOVA 


0000 Bayesian ANOVA Y 


Dependent Variable 


‘\ Heart Rate 


Model Comparison ¥ 


Fixed Factors Models P(M) P(Midata) BFw BF10 


& Gender 


A Gr 


Bayes Factor Tables 
O BF» O Effects 
BF Across all models 
Log(BF) © Across matched models 


Estimates 
Model averaged R? 
Descriptives 
Credible interval 950  % 
Order Plots 
Compare to best model Model averaged posteriors 


oup 


Null model 2.130e-126  8.521e-126 1.000 
Gender + Group + Gender # Group 0.814 17.513  3.822e+125 
Gender + Group 0.206 0.186 0914 8.728e+124 
Group 0 6212e-36 24858-35 2916e+90 
Gender 1678e-107 6.711e-107 7.876e+18 2.129e-25 


Analysis of Effects - Heart Rate 


Effects P(incl) Plexcl) Plinclldata) P(exclldata) BFna 


Gender 0.400 1910e-14 3.491e+13 
Group 0. 0.400 1.910e-14 3.491e+13 
Gender *: Group 0.800 814 0.186 17.513 


Analysis of Effects - Heart Rate 


Effects Plexcl) Pl(incldata) P(excldata) BF ing 


Gender 0.400 0.186 6.212e-36 2.993e+34 

Group 0.400 0.186 1.678e-107  1.108e+106 

Gender + Group 0.200 0.814 0.186 4.378 
Note. Compares models that contain the effect to equivalent models stripped of the effect 
Higher-order interactions are excluded. Analysis suggested by Sebastiaan Mathôt. 


图 5 A 为 选择 “Effects”;，B 为 选择 Across all models 方法 后 的 BF 输出 结果 ; C 为 选择 


Across matched models 方法 后 的 BFinu 输 出 结果 


结果 汇报 。 贝 叶 斯 ANOVA 的 结果 显示 : 参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011)， 当 前 数据 存在 极 强 的 证 据 支 持 


性 别 主 效应 (BFina = 2.99x1030 和 组 别 主 效应 (BFiau = 1.11x101%) 的 存在 。 女 性 运动 六 分 钟 后 


的 心率 0M = 131.99, SD = 22.72) 高 于 男性 (M = 116.99, SD = 19.84)， 控 制 组 运动 六 分 钟 后 的 心 


Z(M = 139.00, SD = 18.95) 高 于 跑步 组 (M = 109.98, SD = 15.53)。 当 前 数据 存在 中 等 程度 的 证 


据 支 持 性 别 和 组 别 间 交互 作用 


分 别 对 控制 组 和 跑步 组 进 


的 存在 (BFina = 4.38)。 


行 贝 叶 斯 独立 样本 :检验 ， 结 果 显 示 : 在 控制 组 中 ， 女 性 运动 


六 分 钟 后 的 心率 高 于 男性 (BFio= 5.56x10”); 在 跑步 组 中 ， 女 性 运动 六 分 钟 的 心率 高 于 男性 


(BFi0= 5.48x10'). 


3.3 单 因 素 重 复 测 量 方差 分 析 


示例 数据 。 使 用 来 自 于 单 


因素 组 内 设计 实验 的 Bush Tucker Food 数据 作为 示例 。 自 变 
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la 


是 食物 种 类 ， 因 变量 为 吃 下 食物 后 感到 反胃 需要 的 时 间 ( 秒 )。 数 据 的 组 织 形式 采用 宽 数 


据 (wide data) 的 形式 ， 与 SPSS 中 进行 分 析 时 的 数据 组 织 形式 相同 。 


操作 步骤 。 首 先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA -Bush Tucker Food), 


然后 在 ANOVA 面板 中 选择 “Bayesian Repeated Measures AVOVA”。 之 后 需要 进行 以 下 步 又 


( 见 图 0): 第 一 ， 设 置 新 的 重复 测量 因子 ， 为 每 个 水 平 进 行 命名 ;第 二 ， 在 “Bayes Factori 


项 框 中 选择 BFio 作 为 要 输出 的 BF 的 形式 ， 第 三 ， 在 “order” 选 项 框 中 选择 “compare to null 


model”; 第 四 ， 由 于 该 示例 数据 中 的 自 变 量 食物 种 类 是 一 个 四 水 平 组 内 变量 ， 因 此 需要 事 


后 检验 来 观测 差异 究竟 出 现在 哪 两 个 水 平 之 间 。 


结果 汇报 。 对 结果 的 汇报 可 以 参考 先前 对 单 因 素 方差 分 析 的 汇报 形式 。 


| Acetebrty |$ stickinsect | $$ Kangaroo Testice | Fish Eye |% Wichety Grub | | | | 
Y Bayesian Repeated Measures ANOVA 60000 


& Colebrity Repeated Measures Factors 
Animal 
Stick Insect 
Kangaroo Testicle 
Fish Eye 
Witchetty Grub 
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8 
9 
6 
5 
8 
7 


x 


10 


New Level 


ale [v olo æl ojo 


1 
2 
3 
1 
5 
6 
$ 
8 


ojn alalolrwlalw 


12 New Factor 


Repeated Measures Cells 

> Stick Insect Stick Insect 
Kangaroo Testicle Kangaroo Testicle 
Fish Eye Fish Eye 
Witchetty Grub Witchetty Grub 


Between Subject Factors 


Ds 


6 使 用 JASP 进行 单 因 素 重 复 测 量 方差 分 析 的 操作 截屏 


3.4 二 因素 重复 测量 方差 分 析 


3.4.1 ”实验 设计 为 组 内 设计 


示例 数据 。 酒 精 态度 (Alcohol Attitudes) 采 用 的 是 3x3 组 内 设计 。 自 变量 是 图 


N 
oF 
sat 


N 
让 
NI 


(Imagery) 和 饮品 种 类 (Drink)， 三 个 水 平 ， 因 变量 为 被 试 在 观 


图 片 后 对 饮品 的 态度 记 
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图 7 示例 数据 酒精 态度 的 描述 统计 结果 


操作 步骤 。 首 先 在 JASP 中 打开 数据 (Open - Data Library - ANOVA - Alcohol Attitudes), 


然后 在 ANOVA 面板 中 选择 “Bayesian Repeated Measures AVOVA”。 之 后 需要 进行 以 下 步骤 


( 见 图 8): 第 一 ， 设 置 两 个 重复 测量 因子 并 对 不 同 因子 的 不 同 水 平 进行 命名 ; 第 二 ， 在 


“Bayes Factor "选项 框 中 选择 BFio 作为 要 输出 的 贝 叶 斯 因子 的 形式 ;第 三 ， 在 “order' 选 项 杠 


中 选择 “compare to null model”; 第 四 ， 在 “Tables” 选 项 框 中 勾 选 “Across matched models” X 


计算 BFina; 第 五 ， 由 于 贝 叶 斯 ANOVA 没有 简单 效应 分 析 的 模块 ， 因 此 需要 通过 贝 叶 斯 1 


检验 进行 简单 效应 分 析 。 
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~ |) & participant po | Bayesian Repeated Measures ANOVA 
Drink 


Beer Modal Comparison 
Wine Models PM) P(Midata) BFw BFio error h 
Water x Nuli model (Incl. subject and random slopas) 0200 。 7748e-24  3.099e-23 1.000 
Drink + Imagery + Drink Imagery 0.200 1000 688908 12916123 1852 
New Level 4 Drink + Imagery 0.200 4840e-9 1936e-B 6246e+14 1241 
- Imagery 0.200 。 9665e-10  3866e-3 1247er14 1152 
Imagery X Drink 0.200 3.868e-23 15470-22 4993 1253 
Posiive Tate. Al modals include subject, and random slopes for all repeated measures factors 
Repeated Measures Cells 
rs Analysis of Effects 
beerpos Beer Positive 一 
Effects ind) Pexc) Pfndldata)  P(excl]data) ine 
beemeut Beer Neutral oep. Flere M Tet : 
Drink 0.400 0400 48400-9 。 9665e-10 5.008 
| Baao Imagery 0400 0400  5806e-9 。 4643e-23  1251e+14 
winepos Wine, Positive Dink = Imagery 0200 0.200 4.000 48408-9 2.06668 
Wole. Compares models that contain the effect to equivalen modals stipped of the effect 
wineneut Wire, Neutral Higher-order interactions are excluded Analysis suggested by Sebastiaan Mathot 
> Between Subject Factors 4 
> Post Hoc Tests 
Post Hoc Comparisons - Drink 
PriorOdde Pesterior Odds BFiou emor% 
i 
0587 0271 0461 0.040 
Covariates 0.587 40505 69093 1.60te-B 
= 0.587 39.147 66645 16856-8 
1 
‘lsqit2)) prior. Th 
: Post Hoc Comparisons - Imagery 
* | Bayes Factor Tables = 
Prior Odds Posterior Odds wu error% 
O BF. @ Effects 
Positive Neural 0587 4113er12 TO02e+12  1257e-17 
BFw Across al modols Negativo 0.587 16140318 27480418 15420-22 
Neutral Negative 0587 2M2e+8  3595e+3 _ 2854e-14 
Log(BF»o) © Across matched models 
Estimates 


图 8 使 用 JASP 进行 二 因素 重复 测量 方差 分 析 的 操作 截屏 


ffin 


结果 汇报 。 贝 叶 斯 ANOVA 的 结果 显示 : 参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011)， 当 前 数据 存在 中 等 程度 的 证 据 


j 


支持 饮品 种 类 主 效 应 (BFiau= 5.01) 和 极 强 的 证 据 支 持 图 片 效 价 主 效应 (BFina = 1.25x1029 的 存 


a 
Lin 


事后 检验 发 现 ， 水 的 态度 得 分 低 于 啤酒 (BFio= 69.09) 和 红酒 (3Fio= 66.65)， 啤 酒 和 红酒 


的 态度 得 分 无 差异 (BFio = 0.46); 积极 图 片 的 态度 得 分 高 于 消极 图 片 (38Fio= 2.75x10) 和 中 


TT 


性 


图 片 (BFo=7.00x102， 中 性 图 片 的 态度 得 分 高 于 消极 图 片 (BFio=3.60x109)。 当 前 数据 存 


在 极 强 的 证 据 支 持 图 片 效 价 和 饮品 种 类 间 交 互 作用 的 存在 (BFina= 2.07x109)。 


3.4.2 ”实验 设计 为 混合 设计 


示例 数据 。 举 重 速度 采用 的 是 2x3 混合 设计 。 自 变量 是 抓 握 类 型 (Grip) 和 负重 (RM)， 


因 变 量 为 举重 速度 。 该 数据 需 在 https://jasp-stats.org/teaching-with-jasp/ 中 进行 下 载 。 


操作 步骤 。 首 先 在 JASP 中 打开 数据 ， 然 后 在 ANOVA 面板 中 选择 “Bayesian Repeated 


Measures AVOVA”。 之 后 需要 进行 以 下 步骤 ( 见 图 9): 第 一 ， 设 置 重复 测量 因子 并 对 因子 的 


不 同 水 平 进行 命名 ， 并 将 抓 握 类 型 放 入 “Between Subject Factor” P; 第 二 ， 在 “Bayes Factor” 
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选项 框 中 选择 BF 作为 要 输出 的 贝 叶 斯 因 


oe 


“compare to null model”; 25 


BFina; 第 五 ， 由 于 贝 叶 斯 ANOVA 没有 简单 效应 分 析 的 模块 ， 


行 简单 效应 分 析 


o 


00009 


了 Bayesian Repeated Measures ANOVA 


Repeated Measures Factors 
RM 
30 
50 


70 x 


Repeated Measures Cells 


RM30 30 
RM50 0 
RM70 70 
Between Subject Factors 
> & Grip 


Covariates 


Bayes Factor Tables 
O BF. O Efeds 
BE Across all models 


四 ， 在 “Tables” 选 项 机 


因此 需要 通过 贝 叶 划 


Bayesian Repeated Measures ANOVA ¥ 


Model Comparison 


子 的 形式 ; 第 三 ， 在 “order” 选 项 框 中 选择 


匡 中 多 选 “Across matched models” 来 计算 


T-test 进 


Models 


RM + Grip + RM + Grip 
RM + Grip 
RM 


Grip 
Null model (incl subject and random slopes) 


PM) 


0.200 
0.200 
0.200 
0.200 
0.200 


P(Mļdata) BFw 
0.997 1232.266 
0 0013 
6200e-5 2.480e-4 
4684e-17 1874e-16 


2.066e-17 8264e-17 


Note. All models include subject, and random slopes for all repeated measures factors. 


Analysis of Effects Y 


Effects Pindi) Plexcl) P(inciidata) — P(axcijdata) BFma 
RM 0.400 0.400 0.003 6750e-17 4.793e+13 
Grip 0.400 0.400 0.003 6.200e-5 51.190 
RM & Grip 0.200 0200 0.997 0.003 314 084 


Note. Compares models that contain the effect to equivalent models stnpped of the effect, 
ctions are excludes lathot. 


Higher-order interactions ar 


Post Hoc Tests 


Post Hoc Comparisons - RM 


iuded Analysis suggested 


by Sebastiaan Mathi 


Prior Odds Posterior Odds BF10, u error % 
30 50 0.587 20.362 34664 1.812e-4 
70 0.587 5.135e+8 8.742e+8 1.473e-11 


50 70 0.587 


6918 088 


11777 453 __2.024e-8 


Note. The posterior odds have been corrected for multiple testing by fixing to 0.5 the prior 


probability that the null hypothesis holds across all compariso 


(Westfall, Johnson, & Utts, 


1997). Individual comparisons are based on the default t-test with a Cauchy (0, r = 1/sqrt(2)) 
prior. The "U" in the Bayes factor denotes that it is uncorrected. 


图 


结果 汇报 。 贝 叶 斯 方差 分 析 的 结果 显示 : 


9 使 用 JASP 进行 二 因素 重复 测量 方差 分 析 的 操作 截屏 


BF 

1.000 

0.003 2.404 
6.220e-5 1.859 
4699-17 1.905 
20736-17 1.629 


参考 先前 研究 者 对 BF 数值 大 小 所 代表 意义 的 


划分 (Jarosz & Wiley, 2014; Jeffreys, 1961; Wetzels et al., 2011)， 当 前 数据 存在 非常 强 的 证 据 支 


持 抓 握 类 型 主 效应 的 存在 (BFina = 51.19)， 传 统 抓 


在 极 强 的 证 据 支 持 负 和 蓓 主 效 应 的 存在 (BFino = 4.79x1013) 的 存在 。 事 后 检验 发 现 ， 


性 方式 的 举 


速度 快 于 反 握 。 当 前 数据 存 


30% 负 和 荷 


的 举重 速度 快 于 50% 负 荷 (BFio= 34.66) 和 70% 负 和 荷 (BFio = 8.74x108)，50% 负 蓓 的 举重 速度 


快 于 70% 负 荷 (BFio = 11777.45)。 当 前 数据 存在 极 强 的 订 


的 存在 (BFine = 314.08)。 


4 讨论 


本 文 介绍 了 贝 叶 共 


ANOVA 的 基本 原理 


， 特 别 是 使 / 
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E 据 支持 抓 握 方式 和 负荷 间 交 互 作用 


线性 模型 并 进行 模型 比较 的 思维 


方式 。 随 后 结合 实验 心理 学 常用 的 五 种 实验 设计 ， 本 文 展 示 了 如 何在 JASP 中 进行 贝 叶 斯 


ANOVA 及 如 何 汇报 并 解释 统计 结果 ， 为 贝 叶 斯 ANOVA 的 使 


本 文 主要 关注 如 何 理 


下 内 容 进 行 讨论 。 第 一 ， 


提供 示 例 。 


E 解 贝 叶 斯 ANOVA 以 及 如 何在 JASP 中 进行 操作 ， 因 此 未 深入 对 以 


先 验 分 布 的 参数 设 定 。 本 文 的 所 有 示例 均 使 用 JASP 的 默认 设 定 


(Prior: r scale fixed effects = 0.5, r scale random effects = 1, r scale covariates = 0.354; Model Prior: 


Uniform)， 当 研究 者 觉得 有 必要 i 


改 这 些 先 验 本 身 即 是 对 混合 线 怕 


he — 


ye ae 
TEES © > 


2021). Pian, AHEAD 


Hh 


van den Bergh 等 (2020) 认 为 贝 叶 斯 ANOVA 还 存 以 下 两 个 需要 注意 的 问题 : 第 


Wr ANOVA 与 频率 学 派 NHST FARR 


态 分 布 时 ， 其 结果 可 能 


进行 区 分 ， 虽 然 本 文 在 原理 部 分 


TINE 


FE 模型 中 先 验 的 修改 ,而 


汇报 BF 时 要 汇报 实际 数值 ， 而 非 简 


[ 报 BF>3， 而 是 汇报 


行 修改 时 ， 可 在 Additional Options 中 


行 修改 。 由 于 修 


斯 混合 效应 模型 ( 潘 晚 坷 等 , 2022)， 该 方式 也 更 加 灵活 。 第 二 


H —s D 


究 者 可 使 用 RR 中 的 brms 包 来 构建 由 


TTE 


参数 先 验 和 模型 先 验 


， 但 这 仍然 是 容易 混淆 之 处 ， 需 要 研究 者 特别 


的 与 特定 阐 值 进行 比较 (Schmalz et al., 


【 体 数值 。 如 果 需 要 更 为 全 硬 


的 了 解 在 JASP 


行 贝 叶 斯 统计 的 细节 ， 可 以 参考 van Doorn 等 (2021) 的 文章 。 


会 出 现 偏 差 。 该 问题 可 通过 使 


Kruskal-Wallis 检验 ) 或 者 指定 残 差分 布 来 解决 ( 需 在 Stan EE JAGS 中 1 


， 贝 叶 


的 问题 ， 即 当 模 型 被 错误 指定 并 且 残 差分 布 是 非 正 


不 指定 残 差分 布 的 ANOVA( 例 如 ， 


i 


A —» 


ÍT); BF 的 计算 


会 受到 模型 内 参数 先 验 分 布 的 影响 。BF 实质 上 是 两 个 模型 边际 似 然 的 比值 ， 先 验 分 布 的 变 


化 必然 会 导致 BF 的 变化 (Schad et al., 2022; Tendeiro & Kiers, 2019)。 在 复杂 的 实验 设计 


研究 者 在 了 解 并 设置 合适 的 参数 先 验 分 布 是 困难 的 。 因 
分 布 参 数 设 定 。 


贝 叶 斯 统计 的 优势 足以 令 心理 


学 等 相关 学 科 的 研究 者 将 


wk, ASCH 


7 


O 


荐 使 用 JASP 默 认 的 先 验 


主意 从 频率 学 派 ANOVA 转移 


到 贝 叶 斯 ANOVA( 胡 传 鹏 等 , 2018; 李 贵 玉 , 顾 昕 , 2021; 许 岳 培 等 , 2022; 郑 元 瑞 , HANS, 
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2023). DUH; ANOVA 可 以 起 到 补充 和 检验 频率 学 派 ANOVA 结果 的 作用 ， 从 而 为 研究 结 


果 提 供 更 为 有 力 的 支持 (Hoijtink et al., 2019). BF 通常 会 使 研究 者 得 出 和 疡 值 一 致 的 结果 。 


当 结 果 不 一 臻 时， 建议 研究 者 按 以 下 流程 对 结果 进行 报告 : 1. 详 细 地 报告 BF 和 疡 值 的 结果 


及 各 自 所 代表 的 含义 ，2. 研 究 者 在 做 出 结论 时 要 持 有 谍 慎 态度 ， 避 免 对 结果 的 过 度 解读 。 


当 这 两 种 统计 方法 得 出 不 一 致 的 结论 时 ， 可 能 有 多 个 原因 ， 例 如 ， 当 前 研究 的 效应 量 不 够 


稳定 ， 或 者 当前 的 数据 不 满足 ANOVA 分 析 的 前 提 预 设 。 这 提示 研究 者 需要 反思 当前 研究 ， 


包括 样本 量 是 否 足 够 、 在 实验 中 对 无 关 变量 的 控制 情况 等 。 同 时 ， 这 也 启发 研究 者 要 在 收 


集 数据 前 确定 关键 效应 的 量 值 。 基 于 此 ， 贝 叶 斯 因子 序列 分 析 为 研究 者 提供 了 一 个 新 的 分 


析 视 角 。 该 方法 要 求 研究 者 在 实验 数据 收集 开始 前 ， 就 要 根据 研究 设计 或 假设 确定 关键 效 


应 。 在 保证 研究 获得 足够 证 据 的 前 提 下 ， 设 置 停止 收集 数据 的 规则 。 在 数据 收集 的 过 程 中 ， 


研究 者 可 以 对 数据 进行 持续 地 分 析 ， 直 到 BF 和 样本 量 达 到 阔 值 ， 就 可 以 停止 数据 收集 ( 详 


细 步 骤 和 实现 教程 可 参考 ; 郑 元 瑞 , 胡 传 鹏 , 2023)。 


BF 会 比 p 值 更 加 保守 并 提供 更 直观 的 信息 (Dong & Wedel, 2017)。 更 为 重要 的 是 ， 随 着 


贝 叶 斯 统计 的 应 用 以 及 相关 软件 和 软件 包 的 开发 (例如 ，JASP、Stan、JAGS、BayesFactor、 


brms, bain, BANOVA 和 PyMC 等 )， 研 究 者 能 更 加 快速 、 方 便 地 开展 贝 叶 斯 分 析 。 为 了 贝 


叶 斯 分 析 的 稳定 性 和 可 重复 性 ， 研 究 者 也 提出 了 一 系列 分 析 指 南 (Schad et al., 2022; van 


Doom et al., 2021)。 总 之 ， 贝 叶 斯 统计 的 应 用 能 够 为 解决 心理 学 的 可 重复 危机 做 出 重要 贡献 。 


18 / 24 


参考 文献 


HAAR HS, 孔 祥 祯 , Wagenmakers, E. J., Alexander, L. Y., 绢 凯 平 . (2018). 贝 叶 斯 因子 及 其 在 JASP 


中 的 实现 . FEEL, 26(6), 951-965. 


李 贵 玉 , 顾 昕 . (2021). 贝 叶 斯 统计 方法 的 应 用 与 现状 . PEALE, 41(5), 466-473. 


TAL, 董 月 晴 , RE. (2021). 概念 内 隐 记 忆 中 的 注意 促进 效应 . DAIR, 53(5), 469-480. 


uy 


潘 晚 坷 , 温 秀 娟 , 金海 洋 . (2022). 贝 叶 斯 混合 效应 模型 在 心理 学 中 的 应 用 教程 . 


CSTR:32003.36.ChinaXiv.202210.00098.V3 


FPL, 顾全 , 施 壮 华 , 高 在 峰 , 沈 模 卫 . (2018). 跳出 传统 假设 检验 方法 的 陷阱 一 一 贝 叶 斯 因子 在 


心理 学 研究 领域 的 应 用 . A/D LES, 24(3), 195-202. 


VP Gea, 陆 春 雷 , ESB, 宋 琼 雅 , PE, AEI. (2022). 评估 零 效 应 的 三 种 统计 方法 . AA De 


学 28(3), 369-384. 


郑 元 瑞 , 胡 传 鹏 . (2023). 贝 叶 斯 因子 序列 分 析 : 实验 设计 中 平衡 信息 与 效率 的 新 方法 . 应 历 心 


Brydges, C. R., & Gaeta, L. (2019). An introduction to calculating Bayes factors in JASP for speech, 
language, and hearing research. Journal of Speech, Language, and Hearing Research, 62(12), 
4523-4533. 

Chib, S. (1995). Marginal likelihood from the Gibbs output. Journal of the American Statistical 
Association, 90(432), 1313-1321. 

Chib, S., & Jeliazkov, I. (2001). Marginal likelihood from the Metropolis—Hastings output. Journal 
of the American Statistical Association, 96(453), 270-281. 

Derks, K., de Swart, J., Wagenmakers, E. J., Wille, J., & Wetzels, R. (2021). JASP for audit: 
Bayesian tools for the auditing practice. Journal of Open Source Software, 6(68), 2733. 


19/24 


Dong, C., & Wedel, M. (2017). BANOVA: An R package for hierarchical Bayesian ANOVA. 


Journal of Statistical Software, S(9), 1-46. 


Faulkenberry, T. J., Ly, A., & Wagenmakers, E.-J. (2020). Bayesian inference in numerical cognition: 


A tutorial using JASP. Journal of Numerical Cognition, 6(2), 231-259. 


Fritz, C. O., Morris, P. E., & Richler, J. J. (2012). Effect size estimates: Current use, calculations, 


and interpretation. Journal of Experimental Psychology: General, 141(1), 2-18. 


Grünwald, P., de Heide, R., & Koolen, W. M. (2020). Safe testing. In 2020 Information Theory and 


Applications Workshop (ITA) (pp. 1-54), San Diego, CA, USA. 


Gelman, A., Hill, J., & Yajima, M. (2012) Why we (usually) don't have to worry about multiple 


comparisons. Journal of Research on Educational Effectiveness, 5(2), 189-211. 


Heck, D. W., & Bockting, F. (2021). Benefits of Bayesian model averaging for mixed-effects 


modeling. Computational Brain & Behavior, 6, 35-49. 


Heck, D. W., Boehm, U., Boing-Messing, F., Burkner, P. C., Derks, K., Dienes, Z., ... Hoijtink, H. 


(2022). A review of applications of the Bayes factor in psychological research. Psychological 


Methods, 28(3), 558-579. 


Hendriksen, A., de Heide, R., & Grünwald, P. (2021). Optional stopping with Bayes factors: A 


categorization and extension of folklore results, with an application to invariant situations. 


Bayesian Analysis, 16(3), 961-989. 


Hinne, M., Gronau, Q. F., van den Bergh, D., & Wagenmakers, E. J. (2020). A conceptual 


introduction to Bayesian model averaging. Advances in Methods and Practices in 


Psychological Science, 3(2), 200-215. 


Hoijtink, H., Mulder, J., Van Lissa, C., & Gu, X. (2019). A tutorial on testing hypotheses using the 


20/24 


Bayes factor. Psychological Methods, 24(5), 539-556. 

Jarosz, A. F., & Wiley, J. (2014). What are the odds? A practical guide to computing and reporting 
bayes factors. The Journal of Problem Solving, 7(1), Article 2. 

JASP Team. (2022). JASP (Version 0.16.3) [Computer software]. Retrieved from https://jasp- 
stats.org/ 

Jeffreys, H. (1961). Theory of probability (3rd Ed.). Oxford, UK: Oxford University Press. 

Kruschke, J. K., & Liddell, T. M. (2018). The Bayesian new statistics: Hypothesis testing, estimation, 
meta-analysis, and power analysis from a Bayesian perspective. Psychonomic Bulletin & 
Review, 25(1), 178-206. 

Liang, F., Paulo, R., Molina, G., Clyde, M. A., & Berger, J. O. (2008). Mixtures of g priors for 
Bayesian variable selection. Journal of the American Statistical Association, 103(481), 410- 
423. 

Morey, R. D., & Rouder, J. N. (2022). BayesFactor: Computation of Bayes factors for common 
designs [R _ package version 0.9.12-4.4]. Retrieved from _ https://CRAN.R- 


project.org/package=BayesFactor 


Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. 
Science, 349(6251), aac4716. 

Rouder, J. N., Morey, R. D., Speckman, P. L., & Province, J. M. (2012). Default Bayes factors for 
ANOVA designs. Journal of Mathematical Psychology, 56(5), 356-374. 

Rouder, J. N., Morey, R. D., Verhagen, J., Swagman, A. R., & Wagenmakers, E. J. (2017). Bayesian 
analysis of factorial designs. Psychological Methods, 22(2), 304-321. 

Schad, D. J., Nicenboim, B., Burkner, P. C., Betancourt, M., & Vasishth, S. (2022). Workflow 


21/24 


techniques for the robust use of bayes factors. Psychological Methods. Advance online 


publication. 


Schmalz, X., Biurrun Manresa, J., & Zhang, L. (2021). What is a Bayes factor? Psychological 


Methods. Advance online publication. 


Srinivasan, M. R., & Vijayaragunathan, R. (2021). Bayes factors for comparison of two-way 


ANOVA models. Journal of Statistical Theory and Applications, 19(4), 540-546. 


Tendeiro, J. N., & Kiers, H. A. L. (2019). A review of issues about null hypothesis Bayesian testing. 


Psychological Methods, 24(6), 774-795. 


van den Bergh, D., van Doorn, J., Marsman, M., Draws, T., van Kesteren, E.-J., Derks, K., ... 


Wagenmakers, E.-J. (2020). A tutorial on conducting and interpreting a bayesian ANOVA in 


JASP. L’Année psychologique, 120(1), 73-96. 


van den Bergh, D., Wagenmakers, E. J., & Aust, F. (2023). Bayesian repeated-measures analysis of 


variance: An updated methodology implemented in JASP. Advances in Methods and Practices 


in Psychological Science, 6(2). 


van Doorn, J., van den Bergh, D., Bohm, U., Dablander, F., Derks, K., Draws, T., ... Wagenmakers, 


E. J. (2021). The JASP guidelines for conducting and reporting a Bayesian analysis. 


Psychonomic Bulletin & Review, 28(3), 813-826. 


Wagenmakers, E. J., Lodewyckx, T., Kuriyal, H., & Grasman, R. (2010). Bayesian hypothesis 


testing for psychologists: A tutorial on the Savage-Dickey method. Cognitive Psychology, 


60(3), 158-189. 


Wagenmakers, E. J., Love, J., Marsman, M., Jamil, T., Ly, A., Verhagen, J., ... Morey, R. D. (2018). 


Bayesian inference for psychology. Part II: Example applications with JASP Psychonomic 


22/24 


Bulletin & Review, 25(1), 58-76. 


Wagenmakers, E. J., Marsman, M., Jamil, T., Ly, A., Verhagen, J., Love, J., ... Morey, R. D. (2018). 


Bayesian inference for psychology. Part I: Theoretical advantages and practical ramifications. 


Psychonomic Bulletin & Review, 25(1), 35-57. 


Wagenmakers, E. J., Wetzels, R., Borsboom, D., & van der Maas, H. L. (2011). Why psychologists 


must change the way they analyze their data: the case of psi: comment on Bem (2011). Journal 


of Personality and Social Psychology, 100(3), 426-432. 
Wetzels, R., Matzke, D., Lee, M. D., Rouder, J. N., Iverson, G. J., & Wagenmakers, E. J. (2011). 


Statistical evidence in experimental psychology: An empirical comparison using 855 t tests. 


Perspectives on Psychological Science, 6(3), 291-298. 


23/24 


14 


15 


16 


17 


18 


19 


20 


21 


22 


23 


24 


The implementation of Bayesian ANOVA in JASP: A practical 


primer 


WANG Yunhong!, Don van den Bergh’, Frederik Aust”, Alexander Ly’, Eric-Jan 
Wagenmakers’, HU Chuanpeng* 
(‘Department of Psychology, School of Education, Shanghai Normal University, Shanghai 
200234, China) 
(Department of Psychological Methods, University of Amsterdam, 1018 VZ Amsterdam, The 
Netherlands) 
(Centrum Wiskunde & Informatica, 1090 GB Amsterdam, The Netherlands) 


(‘School of Psychology, Nanjing Normal University, Nanjing, 210024, China) 


Abstract: The application of Bayesian statistics to hypothesis testing - Bayes factors - is increasing 
in psychological science. Bayes factors quantify the evidence supporting the competing hypothesis 
or model, respectively, thereby making a judgment about which hypothesis or model is more 
supported by the data based on its value. The principles and applications of Bayes factor for ANOVA 
are, however, not available in China. We first present the theoretical foundation of Bayesian ANOVA 
and its calculation rules. It also shows how to perform Bayesian ANOVA and how to interpret and 
report the results of five common designs (one-factor between-group design, one-factor within- 
group design, two-factor between-group design, two-factor within-group design, and two-factor 
mixed design) using example data. Theoretically, Bayesian ANOVA is an effective alternative to 
conventional ANOVA as a powerful vehicle for statistical inferences. 
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